重磅直播 | Python数据爬取和案例实操,学子训练营第11天
会计学术联盟(ID:KJXSLM)
——为高端财会人的智慧成长赋能
传播会计前辈思想,引领青年一代成长
因缘分相聚,因互助成长,因智慧光华
建 议 盟 友| 星 标 我 们
不再遗憾错过 ☆ 每次成长机会
今日暑期训练营关注
课
程
预
告
讲座提纲
引子 安装两个有效的工具
0.1 事先给大家的素材(Python和Pycharm)
0.2 Python的三大特点和安装(共四步)
0.3 Pycharm的两个特点和安装(共八步)
模块一 、爬取网页文本信息
1.1爬取公司年度报告
1.2爬取公司社会责任报告
模块二、文本分析指标的构建
2.1 识别关注重点:以政府工作报告的高频词分析为例
2.2 计算特定词频
2.2.1 方法一:利用STATA——以公司环保“多言寡行”为例
2.2.2 方法二:利用Python——以政府工作报告“民生慈善”为例
2.3 计算语音语调
2.3.1方法一:利用STATA——以公司年报的管理层语调为例
2.3.2方法二:利用Python——以政府工作报告的正负面情感分析为例
2.4 计算可读性
2.4.1方法一:利用STATA——以公司年报的可读性为例
2.4.2方法二:利用Python——以政府工作报告的遣词造句为例
模块三、文本之间关系的度量
3.1 计算重复性/创新性:以政府工作报告的创新表达为例
3.1.1 方法一:Simhash
3.1.2 方法二:Jaccard
3.2 计算不同行业分类之间的相关性:Python的语义分析功能
结语、文本分析的实战应用情景
嘉宾介绍
舍得老师,管理学(会计学)博士,主持教育部人文科学基金一项,国家自然科学基金一项,主要研究方向为政府与非营利组织会计、财务会计理论。科研成果发表于China Journal of Accounting Research(CJAR)、《经济研究》、《世界经济》、《金融研究》、《审计研究》、《管理科学》、《经济管理》等。
主持人
张宁,负责上课开播,录制,主持开场,全程在线
统筹策划
统筹助理朵 朵 西南大学 博士张清燕 石河子大学 2022级博士生
直播技术,答疑
直播技术人员
宋志玮 北京印刷学院 硕士生
陈浩填 吉林财经大学 硕士生
咨询答疑、问题收集人张梦瑶 河南财经政法大学 硕士生武玲羽 中南财经政法大学 本科生
学子考核与计划
编辑部
1
2
3
4
5
文案撰写单佩佩 信阳师范学院 硕士生
图频素材王 荇 郑州轻工业大学 硕士生
推文编辑张馨月 广州华商学院 助教
Stata社会报名通道火热进行中,无限回放~!
详情扫码或请点击阅读原文。
打包更优惠
建议先咨询好再报名
点击上图链接,查看联合发起单位名单
2022暑期训练营助教团名单
统筹
徐晓东、朵朵、张清燕
负责人团队
朵朵、张清燕、张宁、张佩、周萌、雷国鹏、杨征、韩欣孝
资料对接小分队
张清燕、徐晓东、朵朵、王建洋、徐晓东、邢宇鑫、温佳瑜
直播平台小分队
杜美玲、雷国鹏、陈浩填、王明栓、武子祥、石庚岩、宋志玮、娄登峰
编辑小分队
张宁、徐晓东、臧嘉烨、单佩佩、罗爽、兰坤、朱晓颖、张馨月、王荇、刘璐
学子考核、计划组——周萌 、张佩
群答疑、问题收集组——杨征、张梦瑶
WINTER
关注会计学术联盟
为财会人智慧成长赋能
近18万高端财会人关注
前沿.会议.招聘.本硕博